期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 带高效变异尺度系数和贪婪交叉策略的回溯搜索优化算法
王晓娟 刘三阳 田文凯
计算机应用    2014, 34 (9): 2543-2546.   DOI: 10.11772/j.issn.1001-9081.2014.09.2543
摘要354)      PDF (681KB)(540)    收藏

针对回溯搜索优化算法(BSA)收敛速度慢的缺点,提出基于麦克斯韦〖CD*2〗玻尔兹曼分布的变异尺度系数和带贪婪性的交叉策略,来提高算法收敛速度。利用麦克斯韦〖CD*2〗玻尔兹曼分布产生变异尺度系数,能有效提高搜索效率,提高收敛速度;在交换维数较少的交叉策略中使用向优秀个体群学习过的变异种群进行交叉,在充分保证种群多样性的前提下为交叉策略添加了一定贪婪性,成功克服了以往算法添加贪婪性时易陷入局部最优的缺点。对15个标准测试函数进行仿真实验,结果显示,改进算法收敛速度较快,收敛精度较高,即使在高维多峰函数中,相同迭代次数后改进算法的搜索结果比原BSA平均高出近14个数量级,收敛精度均达到10-10以上。

参考文献 | 相关文章 | 多维度评价
2. 基于自动机理论的PDF文本内容抽取
王晓娟 谭建龙 刘燕兵 刘金刚
计算机应用    2012, 32 (09): 2491-2495.   DOI: 10.3724/SP.J.1087.2012.02491
摘要1168)      PDF (757KB)(707)    收藏
现有的从PDF文档抽取文本内容的方法(如PDFBox类库采用的方法)处理速度较低,无法满足高速网络中内容分析的需求,也不能对网络中部分到达的PDF数据包进行流式的处理。为此,提出了基于自动机理论的PDF文本内容抽取方法。该方法通过建立具有层次的关键字自动机,可以快速地抽取完整PDF文档和不完整PDF文档中的文本内容。在中文和英文PDF文档数据集下的实验结果表明,基于自动机理论的PDF文本内容抽取方法耗时仅为PDFBox方法的17%~37%。
参考文献 | 相关文章 | 多维度评价